Spark SQL入門與實踐指南

Spark SQL入門與實踐指南

作者: 紀涵 靖曉文 趙政達
出版社: 清華大學
出版在: 2018-04-01
ISBN-13: 9787302496700
ISBN-10: 7302496706
裝訂格式: 平裝
總頁數: 200 頁





內容描述


Spark SQL是 Spark大數據框架的一部分,支持使用標準SQL查詢和HiveQL來讀寫數據,可用於結構化數據處理,並可以執行類似SQL的Spark數據查詢,有助於開發人員更快地創建和運行Spark程序。 全書分為4篇,共9章,第一篇講解了Spark SQL 發展歷史和開發環境搭建。第二篇講解了Spark SQL 實例,使得讀者掌握Spark SQL的入門操作,瞭解Spark RDD、DataFrame和DataSet,並熟悉 DataFrame 各種操作。第三篇講解了基於WiFi探針的商業大數據分析項目,實例中包含數據採集、預處理、存儲、利用Spark SQL 挖掘數據,一步一步帶領讀者學習Spark SQL強大的數據挖掘功能。第四篇講解了Spark SQL 優化的知識。 本書適合Spark初學者、Spark數據分析人員以及Spark程序開發人員,也適合高校和培訓學校相關專業的師生教學參考。海報:




相關書籍

SQL Server數據庫應用項目化教程(第2版)

作者 陳義文

2018-04-01

Cassandra: The Definitive Guide, (Revised) Third Edition: Distributed Data at Web Scale

作者 Carpenter Jeff Hewitt Eben

2018-04-01

Communicating with Data: Making Your Case with Data

作者 Allchin Carl

2018-04-01